داده کاوی داده های طبی با رویکرد کاهش ابعاد مجموعه‏ی داده

پایان نامه
چکیده

داده‏کاوی یکی از مراحل کشف دانش است و دانش حاصل از داده‏کاوی در زمینه‏های گوناگون از جمله تجارت و پزشکی مورد استفاده قرار می‏گیرد. امروزه با پیشرفت علم و دانش، اطلاعات ذخیره شده در مورد موجودیت‏ها در پایگاه‏داده‏ها نیز در حال افزایش است. مطالعات نشان داده‏اند که بیشتر مواقع همه‏ی اطلاعات در مورد موجودیت‏ها نه تنها برای داده‏کاوی مفید نیستند، بلکه مشکلاتی را برای داده‏کاوی ایجاد می‏کنند. بنابراین سعی می‏شود با استفاده از فرایند انتخاب مولفه، مولفه‏های مفید و مربوط برای یادگیری انتخاب شده و مولفه‏های زاید و نامربوط کنار گذاشته شوند. ولی همیشه کنار گذاشتن قطعی برخی مولفه‏ها قبل از داده‏کاوی مطلوب نیست. در این مواقع سعی می‏شود اهمیت مولفه‏ها برای داده‏کاوی مشخص شود که این روند توسط الگوریتم‏های وزن‏دهی مولفه صورت می‏گیرد. انتخاب و وزن‏دهی مولفه از جمله مسائل غیر چند‏جمله‏ای سخت هستند که اخیراً استفاده از الگوریتم‏های تکاملی برای حل این مسائل نتایج قابل قبولی را نشان داده است. طبیعت همواره مورد الهام بسیاری از افراد بوده است؛ به‏طوری‏که افراد مختلف سعی کرده‏اند با استفاده از روندهای موجود در طبیعت به حل مشکلات موجود بپردازند. از جمله الگوریتم‏های تکاملی مبتنی بر طبیعت می‏توان به الگوریتم ژنتیک و مورچه‏ها اشاره کرد. در این راستا در این پایان‏نامه با توجه دقیق به روند موجود در جنگل، الگوریتم تکاملی جدیدی به نام الگوریتم جنگل ارائه شده است. به منظور بررسی کارایی الگوریتم پیشنهادی جنگل، 3 تابع آزمون در حالت 5 و 10 بعدی مورد بررسی قرار گرفته است. نتایج بدست آمده نشان دهنده‏ی برتری قاطع الگوریتم جنگل از نظر زمان و تعداد نسل رسیدن به جواب نزدیک به بهینه نسبت به الگوریتم ژنتیک است. در این پایان‏نامه مساله‏ی وزن‏دهی مولفه با استفاده از الگوریتم پیشنهادی جنگل حل شده است. نتایج آزمایش‏ها بر روی مجموعه داده‏هایی با اندازه‏های مختلف نشان دادند که الگوریتم جنگل می‏تواند کارایی الگوریتم یادگیری نزدیکترین همسایگی را با استفاده از وزن‏دهی مولفه، در 4 مجموعه داده از 7 مجموعه داده‏ی انتخابی به خوبی بهبود ببخشد. به منظور بررسی بیشتر کارایی الگوریتم جنگل، مساله‏ی انتخاب مولفه نیز با استفاده از الگوریتم جنگل حل شده است. نتایج آزمایش‏ها بر روی 6 مجموعه داده نشان دادند که الگوریتم جنگل می‏تواند کارایی الگوریتم نزدیکترین همسایگی را در 4 مجموعه داده به خوبی بهبود ببخشد. در 2 مجموعه داده‏ای که الگوریتم جنگل نتوانسته است بهتر از روش‏های موجود عمل کند، دارای رتبه‏ی دو است.

منابع مشابه

کاربرد الگوریتم های داده کاوی در تشخیص داده های ژئوشیمیایی خارج از ردیف چند متغیره

تشخیص داده‌های خارج از ردیف چند متغیره به کمک الگوریتم‌های داده‌کاوی یکی از نکات ضروری پیش‌پردازش داده‌های اکتشافات ژئوشیمیایی محسوب می‌شود. در این مقاله چهار الگوریتم برآورد چگالی کرنل (KDE)، ضریب خارج از ردیف بودن محلی (LOF)، OPTICS-OF و SVDD که به ترتیب جزو روش‌های آماری، روش‌های مبتنی بر مجاورت، روش‌های مبتنی بر خوشه‌بندی و روش‌های مبتنی بر دسته‌بندی هستند، معرفی شده و کاربرد آنها بر روی دا...

متن کامل

پیش بینی گزارش حسابرس مستقل در ایران : رویکرد داده کاوی

با افزایش مبادلات تجاری، اقتصادی، پیشرفت تکنولوژی اطلاعات و انباشته شدن داده های مالی، تکنیکهای داده کاوی به منظور استفاده بهینه و کارا از این داده ها رواج یافت. هدف این پژوهش پیش بینی گزارش حسابرس مستقل با استفاده از تکنیک های داده کاوی می باشد. اهمیت پیش بینی گزارش حسابرس مستقل در تاثیر آن بر تصمیم گیری استفاده کنندگان می باشد.گزارش حسابرس مستقل در این تحقیق به دو دسته مقبول و غیرمقبول (شامل ...

متن کامل

داده کاوی احتمال وقوع خشک‌سالی در ایران

خشکسالی در سال‌های اخیر خسارات زیادی به کشور وارد ساخته است که باید تلاش کرد تا با استفاده از مدیریت منطقی، حتی‌الامکان خسارات ناشی از آن را کاهش داد. بدین منظور لازم است تا مناطق متأثر از این بلا مقایسه شوند و در اولویت اقدامات مدیریتی قرار گیرند. هدف از انجام این مطالعه تهیه نقشه شاخص خطر خشکسالی ایران است. در این تحقیق داده‌های بارش ماهانه 46 ایستگاه انتخاب شدند. به‌منظور تهیه نقشه شاخص DHI ...

متن کامل

بررسی کاربردهای داده کاوی در نظام سلامت

Introduction: Extensive amounts of data stored in medical databases require the development of specialized tools for accessing the data, data analysis, knowledge discovery, and the effective use of the data. Data mining is one of the most important methods. The article sketches the used Data Mining techniques, and illustrates their applicability to medical diagnostic and prognostic problems. ...

متن کامل

داده کاوی و کاربرد آن در تصمیم‌گیری‌ها

ابهامات محیطی ناشی از مدل‌های نوین کسب و کار سبب تشدید پیچیدگی در تصمیم‌گیری، به‌ویژه در حوزه کسب و کار شده است. به‌طوری‌که بسیاری از متغیر‌های تاثیرگذار ناشناخته بوده و روابط میان آن‌ها نیز غیرخطی و پیچیده است. در چنین شرایطی دیگر نمی‌توان داده‌ها را با ابزارهای سنتی تحلیل نموده و از آن‌ها دانش استخراج کرد. از این روی مقاله حاضر به تشریح تکنولوژی داده کاوی در حوزه هوش محاسباتی و متدولوژی استا...

متن کامل

تخمین میزان بقاء پیوند کلیه با استفاده از داده کاوی

هدف: نارسایی کلیه از مشکلات پرهزینه جوامع انسانی به‌شمار می‌رود و استفاده از درمان‌های جایگزین در حوزه کلیه در جهان و ایران رو به افزایش می‌باشد. بقاء یکی از حوزه‌های پیش‌آگهی پزشکی است و داده کاوی فرایند کشف روابط و الگوهای مناسب در داده‌هاست که به عنوان روشی کارامد برای تحلیل بقاء شناخته می‌شود. هدف مطالعه حاضر، پیش‌بینی بقاء پیوند کلیه بیمار بر اساس متغیرهای پیش از پیوند کلیه می‌باشد. مواد ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده علوم ریاضی

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023